Понятия со словосочетанием «естественный язык»

Есте́ственный язы́к — в лингвистике и философии языка язык, используемый для общения людей (в отличие от формальных языков и других типов знаковых систем, также называемых языками в семиотике) и не созданный целенаправленно (в отличие от искусственных языков).
Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.
Нижеследующий набор инструментов обработки естественного языка является популярным сборником ПО для обработки естественного языка ( (англ.) NLP). ПО включает набор библиотек, фреймворков и пакетов для символического и статистического анализа естественного языка и обработки речи. Инструменты NLP обычно выполняют обнаружение предложений, токенизацию, определение частей речи, речевых оборотов, лемматизацию, анализ и разрешение кореферентности и т. п.

Связанные понятия

Гиперсхемати́ческие языки́ — апостериорные международные искусственные языки схематического типа, в которых некоторые деривационные и грамматические морфемы имеют априорный характер, однако корни заимствуются из естественных языков. В континууме апостериорности (от меньшей апостериорности к большей) следуют за априорными языками и предшествуют гипосхематическим.
Ме́тод синтакси́ческих шабло́нов — техника автоматического преобразования формализованных структур знаний, хранимых в базе данных, в тексты естественного языка, основана на концепции падежной грамматики Чарльза Филлмора.
Абстрактный семантический граф — это более высокий уровень абстракции, чем абстрактное синтаксическое дерево (АСД), которое используется для описания синтаксической структуры выражения или программы.
Формализа́ция — представление какой-либо содержательной области (рассуждений, доказательств, процедур классификации, поиска информации, научных теорий) в виде формальной системы или исчисления.
Алгоритми́ческий язык — формальный язык, используемый для записи, реализации или изучения алгоритмов. Всякий императивный язык программирования является алгоритмическим языком, но не всякий алгоритмический язык пригоден для использования в качестве языка программирования . Неимперативные языки программирования на алгоритмический язык не выражаются, или выражаются неоднозначно.
Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путём индексирования) по запросу пользователя.
Лингвистическое программное обеспечение (англ. lingware = linguistic + software) — компьютерные программы и данные, обеспечивающие анализ, обработку, хранение и поиск аудиоданных, рисунков (OCR) и текстов на естественном языке.
Информационный язык — специализированный искусственный язык, используемый в различных системах обработки информации. От информационных языков следует отличать языки программирования, машинные языки и формализованные языки науки. Обычно различают...
Метаязы́к — язык, предназначенный для описания другого языка, называемого объектным языком.
Порожда́ющая грамма́тика (генеративная грамматика, англ. generative grammar) — формализм генеративной лингвистики, связанный с изучением синтаксиса. В рамках подхода порождающей грамматики формулируется система правил, при помощи которых можно определить, какая комбинация слов оформляет грамматически правильное предложение. Термин введён в научный оборот в работах Ноама Хомского в конце 1950-х годов (в ранних версиях теории Хомского использовался термин трансформационная грамматика, англ. transformational...
Грамматическое значение — значение, выражаемое словоизменительной морфемой (грамматическим показателем).
Зна́ковая систе́ма — система, состоящая из множества знаков и отношений между ними, основное понятие семиотики. Обеспечивают единообразное представление и интерпретацию сообщений или сигналов, которыми обмениваются в процессе общения. Таким образом знаковые системы структурируют процесс общения и придают ему предсказуемость.
Гипосхемати́ческие языки́ — апостериорные международные искусственные языки схематического типа, не допускающие (в отличие от эсперанто, идо) использования априорных морфем, но обладающие собственными (автономными) правилами словообразования, в результате чего образуются априорные дериваты: идиом-неутраль — redaktator ‘редактор’, infektasion ‘инфекция’, Slovianski-P — morni ‘морской’. Могут рассматриваться как переходные к натуралистическому типу.
Де́йксис (др.-греч. δεῖξις — указание) в лингвистике — указание как значение или функция языковой единицы, выражается лексическими и грамматическими средствами.
Априо́рный язы́к (от лат. a priori «из предшествующего») — искусственный язык, элементы которого не заимствованы из существующих языков, а созданы произвольно либо на основе какой-либо логической (философской) концепции. Этим он отличается от апостериорных языков.
Вербализация (от лат. verbum — глагол) или оглаголивание — переход слов других частей речи в разряд глаголов.
Концептуальное программирование - подход к программированию, описанный Э.Х. Тыугу в одноименной книге . К. программирование предполагает оперирование понятиями (концептами), описанными в терминах предметной области, что позволяет использовать ЭВМ на этапе постановки задачи. Достаточно точное описание задачи позволяет ЭВМ автоматически составлять программы для её решения. Характерными особенностями концептуального программирования являются также использование языка предметной области и использование...
Синтаксическая ошибка может возникать при некорректном вводе уравнения в калькулятор. Это может быть вызвано, например, путём открытия скобок без их закрытия, или, реже, вводом нескольких десятичных разделителей подряд.
Компилятор компиляторов — программа, воспринимающая синтаксическое или семантическое описание языка программирования и генерирующая компилятор для этого языка.
Синтаксис языка программирования — набор правил, описывающий комбинации символов алфавита, считающиеся правильно структурированной программой (документом) или её фрагментом. Синтаксису языка противопоставляется его семантика. Синтаксис языка описывает «чистый» язык, в то же время семантика приписывает значения (действия) различным синтаксическим конструкциям.
Апостерио́рный язы́к (от лат. a posteriori — из последующего) — искусственный язык, элементы которого заимствованы из существующих языков, в противоположность априорному языку.
Перцепти́вная фоне́тика (лат. perceptio — «восприятие») — раздел фонетики, рассматривающий восприятие звуков речи человеческими органами слуха. Отвечает на вопрос о том, какие звуковые свойства существенны для восприятия речи человеком (например, для опознания определённой фонемы) с учётом меняющихся акустических и артикуляционных характеристик речевых сигналов, то есть каковы перцептивные корреляты релевантных (существенных) признаков фонем и просодем.
Синтаксис (в логике) (логический синтаксис) — раздел формальной логики, изучающий правильность построения выражений, безотносительно к тому, есть ли у этих выражений логические значения и если есть, то какие именно.
Семанти́ческий ана́лиз — этап в последовательности действий алгоритма автоматического понимания текстов, заключающийся в выделении семантических отношений, формировании семантического представления текстов. Один из возможных вариантов представления семантического представления — структура, состоящая из «текстовых фактов». Семантический анализ в рамках одного предложения называется локальным семантическим анализом.
Язы́к запро́сов — это искусственный язык, на котором делаются запросы к базам данных и другим информационным системам, особенно к информационно-поисковым системам.
Дискурси́вный ана́лиз — изучение языка, используемого членами некоторого языкового сообщества. В ходе такого анализа рассматривается как форма языка, так и его функция. В качестве исходного материала берутся разговорная речь и письменные тексты. Идентифицируются лингвистические особенности понимания различных текстов и типов устной речи.
Лексическая семантика является частью семантики, которая занимается значениями (подразделяя их на денотат и коннотат) отдельных лексических элементов слов, морфем и лексем, отличаясь, таким образом, от семантики предложений.
Синтакси́ческая омоними́я — это возможность построить несколько синтаксических структур на основе одной и той же последовательности языковых знаков. Выделяются следующие типы синтаксической омонимии: неоднозначность установления синтаксических связей (стрелочная омонимия), омонимия субъектной и объектной связей (разметочная омонимия) и омонимия множества различных синтаксических групп (конституентная омонимия).
Определяющий предикат представляет собой единство собственного предиката с выражением сущности предмета, фиксируемого родовым предикатом. Таким образом, определяющий предикат - это «комплексный» дефиниционный предикат, представленный в своём полном наборе признаков структурным компонентом (отношением тождества, включения и аддиции) и комплексным семантическим компонентом (родовой (классной) семантикой и семантикой дистинкции).
Семантические вычисления (англ. Semantic computing) — направление информатики, находящееся на стыке семантического анализа, обработки естественного языка, интеллектуального анализа данных и ряда других направлений.
Фразеология (от греч. φράσις — выражение и греч. λογος — понятие, учение) — раздел лингвистики, изучающий устойчивые речевые обороты и выражения — фразеологические единицы. Совокупность фразеологических единиц какого-либо языка также называется его фразеологией.
Предика́т (лат. praedicatum «сказанное») в логике и лингвистике — сказуемое суждения, то, что высказывается (утверждается или отрицается) о субъекте. Предикат находится с субъектом в предикативном отношении и показывает наличие (отсутствие) у предмета некоторого признака.
Корефере́нтность или референциональное тождество — отношение между именами — компонентами высказывания, в котором имена ссылаются на один и тот же объект (ситуацию) внеязыковой действительности (референт).
Граммати́ческая катего́рия — замкнутая система взаимоисключающих и противопоставленных друг другу грамматических значений (граммем), задающая разбиение обширной совокупности словоформ (или небольшого набора высокочастотных словоформ с абстрактным типом значения) на непересекающиеся классы, различие между которыми существенно сказывается на степени грамматической правильности текста.
Идиома программирования — устойчивый способ выражения некоторой составной конструкции в одном или нескольких языках программирования. Идиома является шаблоном решения задачи, записи алгоритма или структуры данных путём комбинирования встроенных элементов языка.
Дедуктивная база данных это система баз данных которая может делать выводы (то есть заключать дополнительные факты) на основе правил и фактов хранящихся в (дедуктивной) базе данных. Datalog это язык, обычно используемый для указания фактов, правил и запросов в дедуктивных базах данных. Дедуктивные базы данных выросли из желания сочетать логическое программирование с реляционной базой данных для построения систем, поддерживающих мощный формализм, и по-прежнему быстры и способны справляться с очень...
Металингвистическая абстракция в информатике — это процесс решения сложных проблем путём создания нового языка или словарного запаса, чтобы лучше понять проблему пространства. Этот вопрос подробно описан в учебнике МТИ «Структура и интерпретация компьютерных программ», который рекомендует использовать язык Scheme как основу для создания новых языков.
Си́нтаксис (др.-греч. σύν-ταξις — составление) — раздел лингвистики, изучающий строение и функциональное взаимодействие различных частей речи в предложениях, словосочетаниях и пр. языковых единицах. Является составной частью грамматики. Исследуемые в рамках синтаксиса вопросы тесно соприкасаются с областью изучения морфологии.
Адвербиализа́ция (от лат. adverbium — наречие) — переход в класс наречий словоформ, принадлежащих другим частям речи.
Сигнифика́т (от лат. significātum — значимое) — понятийное содержание имени или знака.
Логическая семантика — «Философский термин» — («рассуждение», «мысль», «разум») — раздел логики, в котором изучаются отношения языковых символов к обозначаемым ими объектам и выражаемому ими содержанию.
Кома́нда — это указание компьютерной программе действовать как некий интерпретатор для решения задачи. В более общем случае, команда — это указание некоему интерфейсу командной строки, такому как shell.
Сверхвысокоуровневый язык программирования (язык программирования сверхвысокого уровня, англ. very high-level programming language, VHLL) — язык программирования с очень высоким уровнем абстракции. В отличие от языков программирования высокого уровня, где описывается принцип «как нужно сделать», в сверхвысокоуровневых языках программирования описывается лишь принцип «что нужно сделать». Термин впервые появился в середине 1990-х годов для обозначения группы языков, используемых для быстрого прототипирования...
Лексе́ма (от др.-греч. λέξις — слово, выражение, оборот речи) в лингвистике — слово как абстрактная единица морфологического анализа. В одну лексему объединяются разные парадигматические формы (словоформы) одного слова. Например, словарь, словарём, словарю — это формы одной и той же лексемы, по соглашению пишущейся как СЛОВАРЬ.
Гипота́ксис (от др.-греч. ὑπο- «под» + τάξις «расположение») — способ построения сложного предложения. При гипотаксисе синтаксическая связь, соединяющая простые предложения в составе сложного выражена эксплицитно при помощи союзов, относительных местоимений и других служебных слов.
В математической логике и информатике рекурсивный язык — тип формального языка, также называемый разрешимым или разрешимым по Тьюрингу. Класс всех рекурсивных языков часто обозначается через R, хотя это же обозначение используется для класса RP.

Подробнее: Рекурсивный язык
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я